概述

在 Java 中，编译器将源代码转成字节码，那么字节码如何被执行的呢？这就涉及到了 JVM 的字节码执行引擎，执行引擎负责具体的代码调用及执行过程。就目前而言，所有的执行引擎的基本一致：

输入：字节码文件
处理：字节码解析
输出：执行结果。

物理机的执行引擎是由硬件实现的，和物理机的执行过程不同的是虚拟机的执行引擎由于自己实现的。

运行时栈帧结构

栈帧（Stack Frame）是用于支持虚拟机进行方法调用和方法执行的数据结构，它是虚拟机运行时数据区中的虚拟机栈（Virtual Machine Stack）的栈元素。每一个线程都有一个栈。每一个方法从调用开始至执行完成的过程，都对应着一个栈帧在虚拟机栈里面入栈到出栈的过程。

每个栈帧都包括了一下几部分：局部变量表、操作数栈、动态连接、方法的返回地址和一些额外的附加信息。

栈帧中需要多大的局部变量表和多深的操作数栈在编译代码的过程中已经完全确定，并写入到方法表的Code属性中。在活动的线程中，位于当前栈顶的栈帧才是有效的，称之为当前栈帧（Current Stack Frame），与这个栈帧相关联的方法称为当前方法(Current Method)。执行引擎运行的所有字节码指令只针对当前栈帧进行操作。其模型示意图大体如下：

局部变量表

局部变量表是变量值的存储空间，由方法参数和方法内部定义的局部变量组成，其容量用 Slot 作为最小单位。（一个Slot 占有的空间表示能存放一个 boolean、byte、char、int、float、reference 或 returnAddress ，只有 long 或 double 占两个 Slot）在编译期间，就确定了该方法所需要分配的局部变量表的最大容量。由于局部变量表是建立在线程的栈上，是线程的私有数据，因此不存在数据安全问题。

在方法执行时，虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。如果是实例方法，那局部变量表第 0 位索引的 Slot 存储的是方法所属对象实例的引用，因此在方法内可以通过关键字 this 来访问到这个隐含的参数。其余的参数按照参数表顺序排列，参数表分配完毕之后，再根据方法体内定义的变量的顺序和作用域分配。我们知道类变量表有两次初始化的机会，第一次是在“准备阶段”，执行系统初始化，对类变量设置零值，另一次则是在“初始化”阶段，赋予程序员在代码中定义的初始值。和类变量初始化不同的是，局部变量表不存在系统初始化的过程，这意味着一旦定义了局部变量则必须人为的初始化，否则无法使用。

操作数栈

后入先出栈，由字节码指令往栈中存数据和取数据，栈中的任何一个元素都是可以任意的 Java 数据类型。和局部变量类似，操作数栈的最大深度也在编译的时候写入到 Code 属性的 max_stacks 数据项中。

当一个方法刚开始执行的时候，这个方法的操作数栈是空的，在方法的执行过程中，会有各种字节码指令往操作数中写入和提取内容，也就是出栈/入栈操作。操作数栈中元素的数据类型必须与字节码指令的序列严格匹配，这由编译器在编译器期间进行验证，同时在类加载过程中的类检验阶段的数据流分析阶段要再次验证。另外我们说 Java 虚拟机的解释引擎是基于栈的执行引擎，其中的栈指的就是操作数栈。

两个栈帧作为虚拟机栈的元素，是完全相互独立的。但在大多数虚拟机的实现都会做些优化处理，令两部分栈帧出现一部分重叠，这样在进行方法调用中可以共用一部分数据，如下图所示：

动态连接

每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用，持有该引用是为了支持方法调用过程中的动态连接。

方法返回地址

存放调用该方法的 pc 计数器的值。当一个方法开始之后，只有两种方式可以退出这个方法：

执行引擎遇到任意一个方法返回的字节码指令，也就是所谓的正常完成出口。
在方法执行的过程中遇到了异常，并且这个异常没有在方法内进行处理，也就是只要在本方法的异常表中没有搜索到匹配的异常处理器，就会导致方法退出，这种方式成为异常完成出口。

正常完成出口和异常完成出口的区别在于：通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。

无论通过哪种方式退出，在方法退出后都返回到该方法被调用的位置，方法正常退出时，调用者的 pc 计数器的值作为返回地址，而通过异常退出的，返回地址是要通过异常处理器表来确定，栈帧中一般不会保存这部分信息。本质上，方法的退出就是当前栈帧出栈的过程。

附加信息

虚拟机规范允许具体的虚拟机实现增加一些规范里没有描述的信息到栈帧之中。例如调试相关的信息….

方法调用

方法调用的主要任务就是确定被调用方法的版本（即调用哪一个方法），该过程不涉及方法具体的运行过程。
按照调用方式共分为两类：

解析调用是静态的过程，在编译期间就完全确定目标方法。
分派调用即可能是静态，也可能是动态的，根据分派标准可以分为单分派和多分派。两两组合有形成了静态单分派、静态多分派、动态单分派、动态多分派

解析

在 Class 文件中，所有方法调用中的目标方法都是常量池中的符号引用，在类加载的解析阶段，会将一部分符号引用转为直接引用，也就是在编译阶段就能够确定唯一的目标方法，这类方法的调用成为解析调用。此类方法主要包括静态方法 （无法被子类重写）和私有方法两大类，前者与类型直接关联，后者在外部不可访问，因此决定了他们都不可能通过继承或者别的方式重写该方法，符合这两类的方法主要有以下几种：静态方法、私有方法、实例构造器、父类方法。虚拟机中提供了以下几条方法调用指令：

invokestatic：调用静态方法，解析阶段确定唯一方法版本
invokespecial：调用< init >()方法、私有及父类方法，解析阶段确定唯一方法版本
invokevirtual：调用所有虚方法
invokeinterface：调用接口方法
invokedynamic：动态解析出需要调用的方法，然后执行

前四条指令固化在虚拟机内部，方法的调用执行不可认为干预，而 invokedynamic 指令则支持由用户确定方法版本。其中 invokestatic 指令和 invokespecial 指令调用的方法称为非虚方法，其余的（ final 修饰的除外）称为虚方法。

解析调用一定是个静态的过程，在编译期间就可以完全确定，在类加载的解析阶段就会把涉及的符号引用全部转化为可确定的直接引用，不会延迟到运行期再去完成。

分派

分派调用更多的体现在多态上：

静态分派： 所有依赖静态类型来定位方法执行版本的分派称为静态分派，发生在编译阶段，典型应用是方法重载。
动态分派：在运行期间根据实际类型来确定方法执行版本的分派成为动态分派，发生在程序运行期间，典型的应用是方法的重写。
单分派：根据一个宗量对目标方法进行选择。
多分派：根据多于一个宗量对目标方法进行选择。

静态类型和动态类型解释：

1	Human man = new Man(); //Man类是Human的子类

Human 称为变量的静态类型或者叫做外观类型，Man 成为变量的实际类型。区别是静态类型是编译器就可知的；而实际类型是运行期才知道的。

编译器在重载时是通过参数的静态类型而不是实际类型作为判定依据；而在重写时是根据实际来判断该调用哪个方法。

宗量：方法的接受者与方法的参数称为方法的宗量。

Java语言是一门静态多分派、动态单分派的语言。

JVM 实现动态分派

动态分派在 Java 中被大量使用，使用频率及其高，如果在每次动态分派的过程中都要重新在类的方法元数据中搜索合适的目标的话就可能影响到执行效率，因此 JVM 在类的方法区中建立虚方法表来提高性能。每个类中都有一个虚方法表，表中存放着各个方法的实际入口。如果某个方法在子类中没有被重写，那子类的虚方法表中该方法的地址入口和父类该方法的地址入口一样，即子类的方法入口指向父类的方法入口。如果子类重写父类的方法，那么子类的虚方法表中该方法的实际入口将会被替换为指向子类实现版本的入口地址。

虚方法表会在类加载的连接阶段被创建并开始初始化，类的变量初始值准备完成之后，JVM会把该类的方法表也初始化完毕。

基于栈的字节码解释执行引擎

许多 Java 虚拟机的执行引擎在执行 Java 的时候都有解释执行（通过解释器执行）和编译执行（通过即时编译器产生本地代码执行）两种选择。

解释执行

虚拟机在执行代码过程中，到底是解释执行还是编译执行，只有它自己才能准确判断了，但是无论什么虚拟机，其原理基本符合现代经典的编译原理，如下图所示：

在 Java 中，javac 编译器完成了词法分析、语法分析以及抽象语法树的过程，再遍历语法树生成线性字节码指令流的过程，此过程发生在虚拟机外部。而解释器在虚拟机，所以 Java 程序的编译就是半独立的实现。

基于栈的指令集与基于寄存器的指令集

Java 编译器输入的指令流基本上是一种基于栈的指令集架构，指令流中的指令大部分是零地址指令，其执行过程依赖于操作栈。另外一种指令集架构则是基于寄存器的指令集架构，典型的应用是 x86 的二进制指令集，比如传统的 PC 以及 Android 的 Davlik 虚拟机。两者之间最直接的区别是，基于栈的指令集架构不需要硬件的支持，而基于寄存器的指令集架构则完全依赖硬件，这意味基于寄存器的指令集架构执行效率更高，但可移植性差，而基于栈的指令集架构的移植性更高，但执行效率相对较慢，初次之外，相同的操作，基于栈的指令集往往需要更多的指令，比如同样执行2+3这种逻辑操作，其指令分别如下：
基于栈的计算流程（以 Java 虚拟机为例）：

iconst_2  //常量2入栈
istore_1  
iconst_3  //常量3入栈
istore_2
iload_1
iload_2
iadd      //常量2、3出栈，执行相加
istore_0  //结果5入栈

而基于寄存器的计算流程：

1 2	mov eax,1 //将eax寄存器的值设为1 add eax,3 //使eax寄存器的值加3